AI资讯新闻榜单内容搜索-LLaMA

秒杀700亿Llama 2！最新国产大模型亮相，无需申请即可免费商用，背后公司来自私募巨头

国产大模型刚刚出了一位全新选手：参数670亿的DeepSeek。它在近20个中英文的公开评测榜单上直接超越了同量级、700亿的Llama 2。

来自主题: AI资讯

7012 点击 2023-12-06 15:24

通义千问爆甩开源全家桶！最强720亿参数超车Llama 2，新上视觉模型看图直出代码

通义千问开源全家桶正式上线！业界最强72B模型直接超越开源标杆Llama 2-70B，还有1.8B模型、音频大模型全部开源，阿里云这次真的把家底都掏出来了。

来自主题: AI资讯

7018 点击 2023-12-02 11:32

最新Claude2.1、Llama 2随便用！亚马逊把生成式AI开发门槛打下去了

一个提示，让Llama 2准确率飙至80.3%？Meta提出全新注意力机制S2A，大幅降低模型幻觉

大语言模型「拍马屁」的问题到底要怎么解决？最近，LeCun转发了Meta发布的一篇论文，研究人员提出了新的方法，有效提升了LLM回答问题的事实性和客观性。我们一起来看一下吧。

来自主题: AI资讯

7304 点击 2023-11-28 16:00

小模型如何进行上下文学习？字节跳动 & 华东师大联合提出自进化文本识别器

我们都知道，大语言模型（LLM）能够以一种无需模型微调的方式从少量示例中学习，这种方式被称为「上下文学习」（In-context Learning）。这种上下文学习现象目前只能在大模型上观察到。比如 GPT-4、Llama 等大模型在非常多的领域中都表现出了杰出的性能，但还是有很多场景受限于资源或者实时性要求较高，无法使用大模型。

来自主题: AI技术研报

3805 点击 2023-11-27 12:49

这一代AI追随者的窘境

前不久，原阿里首席AI科学家贾扬清的一条朋友圈截图四处流传。贾扬清说，他的一个朋友告诉他，某国产大模型不过是LLaMA架构，只是更换了几个变量名而已。很快有好事者发现，在大模型、数据集开源社区Hugging Face上，就有一位开发者发出了类似质疑：“该模型使用了Meta LLaMA 的架构，只修改个tensor（张量）”。

来自主题: AI资讯

7346 点击 2023-11-26 20:58

LLaMA 2端到端推理打通！来自中国团队

Buddy Compiler 端到端 LLaMA2-7B 推理示例已经合并到 buddy-mlir仓库[1]主线。我们在 Buddy Compiler 的前端部分实现了面向 TorchDynamo 的第三方编译器，从而结合了 MLIR 和 PyTorch 的编译生态。

来自主题: AI技术研报

5154 点击 2023-11-23 20:33

李开复回应 Yi 大模型套壳 LLaMA 争议：受益于开源也贡献开源

针对近日零一万物被质疑完全使用 LLaMA 架构，只对两个张量（Tensor）名称做修改，李开复在朋友圈进行了回应。

来自主题: AI资讯

4938 点击 2023-11-17 10:42

一文盘点2023人工智能进展，不止大模型而已

RLHF今年虽然爆火，但实打实用到的模型并不多，现在还出现了替代方案，有望从开源界“出圈”；大模型透明度越来越低，透明度最高的是Llama 2，但得分也仅有54；

来自主题: AI资讯

5252 点击 2023-11-16 23:35

老黄深夜炸场，世界最强AI芯片H200震撼发布！性能飙升90%，Llama 2推理速度翻倍，大批超算中心来袭

刚刚，英伟达发布了目前世界最强的AI芯片H200，性能较H100提升了60%到90%，还能和H100兼容。算力荒下，大科技公司们又要开始疯狂囤货了。

来自主题: AI资讯

8322 点击 2023-11-14 09:23

AI资讯新闻榜单内容搜索-LLaMA

秒杀700亿Llama 2！最新国产大模型亮相，无需申请即可免费商用，背后公司来自私募巨头

通义千问爆甩开源全家桶！最强720亿参数超车Llama 2，新上视觉模型看图直出代码

最新Claude2.1、Llama 2随便用！亚马逊把生成式AI开发门槛打下去了

一个提示，让Llama 2准确率飙至80.3%？Meta提出全新注意力机制S2A，大幅降低模型幻觉

小模型如何进行上下文学习？字节跳动 & 华东师大联合提出自进化文本识别器

这一代AI追随者的窘境

LLaMA 2端到端推理打通！来自中国团队

李开复回应 Yi 大模型套壳 LLaMA 争议：受益于开源也贡献开源

一文盘点2023人工智能进展，不止大模型而已

老黄深夜炸场，世界最强AI芯片H200震撼发布！性能飙升90%，Llama 2推理速度翻倍，大批超算中心来袭